home *** CD-ROM | disk | FTP | other *** search
/ EnigmA Amiga Run 1997 February / EnigmA AMIGA RUN 15 (1997)(G.R. Edizioni)(IT)[!][issue 1997-02][PLANET CD V].iso / enigma / earcd / utility / utilfile / rw2ent16.rdm < prev    next >
Text File  |  1997-01-18  |  3KB  |  64 lines

  1. Short:    ASCII <-> Entity-Codes or Umlauts
  2. Author:   honma@thepentagon.com (Tamio Patrick Honma)
  3. Uploader: honma@thepentagon.com (Tamio Patrick Honma)
  4. Version:  1.6
  5. Type:     util/conv
  6. Replaces: util/conv/Raw2Ent*
  7.  
  8. Files: CWISENV
  9.        Raw2Ent            1.6   (06.12.96)
  10.        Raw2Ent.doc        [this file]
  11.        Raw2Ent.rexx       1.4.1 (14.07.96)
  12.        Raw2Ent.rexx.old   1.3.4 (01.11.96)
  13.  
  14.  
  15. WHAT'S NEW SINCE LAST RELEASE?
  16.     CHECK-MODE -> this is the mode to check 7-Bit-ASCII
  17.  
  18. NOTE:  Since version 1.5 you can use Raw2Ent as an Ent2Raw!
  19.  
  20. NOTE:   Since  version  1.3  you can use Raw2Ent as a "Raw2Uml", which means
  21. that  the  destination  file  will  contain  readable  characters,  words or
  22. shortcuts.  (i.e.:  "ü" -> "ue", "£" -> "pound", "©" -> "(C)", etc.)
  23.  
  24.  
  25. INTRODUCTION
  26.  
  27. Raw2Ent   converts   raw   8-Bit-ASCII-Text   into   7-Bit-ASCII-Text   with
  28. entity-codes  and  reverse.   The  ASCII-Format is a standardized format for
  29. information  interchange,  but it is only standardized seven-bit-wide, which
  30. means  that  128 codes are defined.  One Byte consists of eight bits and can
  31. represent  256  different  bit  combinations.   Therefore  the  last 128 bit
  32. combinations  are defined for free use by any operation-system.  The problem
  33. is that accent-characters and other special characters are not standardized,
  34. because  they  are defined in (guess where?!  ;) ) the free part of ASCII by
  35. the operation system developers.
  36.  
  37. The  goal of the Wold Wide Web developers was that it could be used on every
  38. important   operation   system.   So  it  was  clear  that  the  ASCII-Based
  39. HTML-Source-Code   had  to  use  the  standardized  seven-bit  area  of  the
  40. ASCII-Code.  To represent accent-characters or other special characters in a
  41. seven-bit-code,  it  was  neccesary  to  invent something.  And this was the
  42. entity-code  -  a  kind  of  escape-code.   An  entity-code  consists  of an
  43. introducing  "&"  and  a  ";"  at  the  end.   Between  these  symbols  is a
  44. character-name the browser can interpret.  It is a very hard and stupid work
  45. to convert the ASCII-Text by hand.  So just use Raw2Ent!
  46.  
  47. Raw2Ent  produces  real 7-Bit-ASCII-Code.  All printable Amiga-characters in
  48. the  8-bit-area  will be converted into entity-codes, without any exception.
  49. The  use  of names instead of code-numbers will make the entity-codes easier
  50. to be read by humans.  If no name was defined in the HTML 3.2 reference, the
  51. code-number will be used.
  52.  
  53. You  can use Raw2Ent also to check, wether your file contains pure seven-bit
  54. codes  or  not.   If  not,  Raw2Ent  will  present  you  the position of the
  55. 8-Bit-Characters in the text.
  56.  
  57.  
  58. SEND COMMENTS TO:
  59.  
  60. Tamio Patrick Honma
  61.  
  62. eMail: honma@thepentagon.com
  63.   WWW: http://www.netforward.com/thepentagon/?honma
  64.